再创丨多重自动化基因组编辑技术研究进展
【编辑注】:本周再创丨Regenesis正式开启了“喜欢作者”功能,如果您觉得本文的文章写得不错,可以在文末对作者进行赞赏哦,具体信息请戳:再创丨关于启用“再创”之名统一进行公众号文章原创标注、赞赏、宣传等活动的公告
作者:李辉
简介:中国科学院大学,青岛生物能源与过程研究所在读硕士,研究方向为蓝细菌CRISPR系统的表征以及新型遗传学技术的开发,研究兴趣还包括微生物代谢工程以及合成生物学。本科毕业于西北农林科技大学,研究兴趣为木质纤维素的定向降解以及单糖的转化。
编辑:孟凡康
全文约5500字,阅读时间约为15分钟
复活猛犸
在2012年的时候,哈佛大学的科学家们开始了一项“疯狂”的计划,他们打算利用基因编辑技术复活已经灭绝的猛犸象,尽管目前还找不到相关的研究进展,但有趣的是一位畅销书作者根据他们的工作写成了一本书《长毛象:复活史上最具标志性的灭绝生物的真实故事》后,这本书在没有出版前电影版权就已经被福布斯买走,故事将要被改编成电影,电影的预算则高达8000万美元。
从技术层面上看,他们的技术路线是以猛犸象的基因组为蓝本,将亚洲象基因组中和猛犸象基因组不同的基因用猛犸象的基因代替,目前猛犸象基因组80%的信息已被科学家破解, 亚洲象是现存的和猛犸象亲缘关系最近的近亲。从原理上来讲只要亚洲象和猛犸不同的基因全部用猛犸的DNA来替换的话,就能让猛犸的性状在亚洲象身上重现,使猛犸再生。
要想实现这样的目标,科学家需要一种高效的,能够在短时间内向一个宿主基因组中引入大量修饰的基因编辑技术,尽管这样的技术在高等生物中的应用还很有限,但过去十年这样的技术在低等的原核生物中已经有了很大的进展。下面将给大家简要介绍一下多重自动化基因组编辑技术(multiplex automated genome editing: MAGE)在近10年的研究进展。
多重自动化基因组编辑技术(Multiplex automated genome editing)(1)
适用于E. coil的MAGE也是由哈佛大学的George Church实验室在2009年首次所报道,他们这个技术的成功之处在于对作为运行MAGE的E. coil做了两处关键的改造。分别是敲除了mutS基因,使得内源的错配修复机器丧失功能,同时向底盘大肠杆菌中表达了来源于λ噬菌体Red系统中的β蛋白,β蛋白能够介导单链DNA或者寡核苷酸结合到复制叉的后随链上,从而实现所介导寡核苷酸和染色体的同源重组。这两处关键的改造均间接或直接的提高了同源重组的效率,使得利用不超过100bp的单链DNA就可以实现对目的位点进行编辑,极大的降低了利用这个技术对大量位点同时进行编辑的核酸制备成本。这样以来就可以按照下图这一系列步骤对基因组中的目标位点进行修饰,多重编辑体现在将寡核苷酸转入宿主时可以同时转入多种序列不同的片段,而自动化体则体现在他们所设计的一系列相应的能够实现上图7步操作的装置,用计算机对整个装置进行控制就可以使MAGE一轮一轮的运转,每轮的时间仅需2-2.5个小时。
这个技术最终所能实现的功能是在单个或群体细胞中快速,连续地定位到染色体的多个位点对其进行修饰(包括错配、插入以及删除),从而可以实现对细胞的大规模编程以及进化。为了验证这个技术的能力,他们用MAGE来协调番茄红素生物合成途径中所涉及各个酶的表达水平。具体的做法是将所涉及的基因整合到一个质粒转入大肠杆菌,然后使用和各个基因同源的在RBS区域包含了人为引入不同突变的寡核苷酸,再利用MAGE对宿主进行重编程,结合相应的筛选方法,加速它向我们期望的方向进化。仅仅在MAGE运行了35个循环之后,所形成的突变体库的容量达到4.7×105个,所挑选出的番茄红素的产率表现最好的菌株比出发菌株提高了5倍。
Optimization of the DXP biosynthesispathway for lycopene production
接合组装基因组编辑技术(Conjugativeassembly genome engineering :CAGE)(2)
Strategy for reassigning all 314 TAG codons to TAA in E. coli.
尽管利用MAGE对基因组进行多位点编辑时已经有不低的效率,但是用于复杂的遗传操作时还是面临所能编辑位点相对较少的问题。比如,科学家想要通过及但实际上完全替换E. coil中的一种特定的密码子,从而构建出对某些病毒产生免疫能力的菌株,以E. coil中的一种终止密码子TAG为例,其在全基因组范围内的数量为314个,而MAGE在10轮以内对一个细胞群体中大部分细胞基因组修饰的数量仅仅是个位数,这显然不能达到预期的目标。为了解决这种问题,在2011年和MAGE互补的CAGE技术应用而生,将MAGE核CAGE结合起来有助于解决上述问题,相应的技术路线是先将E. coil 4.5M的基因组进行分区,总共分成32个区,每个区含有10个左右的TAG。先用MAGE对每个子区间的TAG进行修改,随后用CAGE将32个分散的经过修饰的子区域逐步组装起来,遗憾的是目前在不影响宿主生存的前提条件下只完成了所需的31次组装中的28次。
CAGE能够有效的将经过修饰的区域组装起来的关键在于研究者们将在供体菌中的结合转移因子和oriT进行了解偶联,并且分别在供体和受体被修饰区域的两端插入了不同的选择标签,确保修饰区域能够进行正确的组装。
这两个技术结合起来能够放大MAGE的优点,显著提高了MAGE所能够修饰的位点的数目,但MAGE技术本身所具备的缺点即背景突变,也被显著地放大了,背景突变率上升是内源错配修复机器丧失活性所导致的。比如在将8个1/32菌株基因组被修饰的部分组装到一个菌株中去时,正确的修饰位点应该是80个,但是调查2个功能紊乱和一个功能正常的1/4菌株时发现他们次级突变的数量分别为110,102和128个。
MAGE的优化
为了解决MAGE使用时背景突变率高的问题,所提出的第一个解决策略是使用包含修饰碱基的寡核苷酸(3),在mutS+菌株中使用包含修饰碱基的寡核苷酸和未修饰碱基的寡核苷酸对基因组进行修饰,其中使用2’-Fluoro-Uridine, 5-Methyl-deoxyCytidine, 2,6-Diaminopurine 或者Iso-deoxy Guanosine分别代替T、C、A或者G时对重组效率的提高最大,前者的重组效率可以达到后者的10-20倍,在重组效率得到显著提高后就可以不用去除掉内源错配修复系统的功能,这样也就达到了降低背景突变率的效果。
但在将宿主中的mutS敲除掉之后包含修饰碱基的寡核苷酸的重组效率又得到了进一步的提升,而且在将这些修饰碱基整合到基因组中时也没有对宿主的生存产生明显的影响。这些结果说明基因组中含有修饰碱基的错配能够在一定程度上规避掉内源错配修复系统对其的修复。但是将使用包含修饰碱基的寡核苷酸这一策略整合到MAGE中去时又会面临成本以及这种大量的含有修饰碱基的寡核苷酸的获取问题。
第二个对MAGE的优化不是降低这个方法所带来的高背景突变率,而是进一步提高对目的位点修饰时的重组效率,研究者所提出来的策略叫做基于共选择的MAGE(Co-selection strategy based on MAGE:CoS-MAGE)(4),这个策略中的共选择体现在利用寡核苷酸引入的在染色体中不同位置的突变会在一条链上富集,而如果在引入的这些突变之中将能够改变宿主对抗生素抗性的突变包含进去,再利用相应的选择压力就可以将期望的突变体筛选出来。以能够赋予宿主抗生素抗性的突变为中心,周围500kb之内的修饰都可以通过这种策略得到不同程度的富集,离中心越近,被富集的概率越高,幸运的是在基因组水平上每500kb之内找到一个能够赋予某种抗生素抗性的突变问题不是很大。
Mechanism for MAGE AR with CoS. The dividing chromosome is schematized,with integration of a mutagenic oligo into the genome at a replication fork.
前面所提到的两种对MAGE的优化并没有同时兼顾对背景突变率的降低以及重组效率的强化。同时将这两个方面兼顾所采取的第一个策略是向表达了重组酶的E. coil K12 1655中引入对温度敏感的MMR蛋白的等位基因[MutS(A134V)和MutL(G62S)](5),在对宿主基因组进行编辑的开始阶段先在42℃诱导重组酶表达同时抑制MMR蛋白的活性,在重组完成后,为下一轮的编辑准备感受态的过程中又通过改变温度至32℃使得MMR蛋白能够正常表达,能行使正常的错配修复功能。这样以来,和传统的MAGE相比,这个策略在寡核苷酸介导的同源替换中效率和准确性没有明显降低的前提之下,背景突变率降低了85%。尽管这些步骤还未用相应的装置自动化,但是将这几个步骤进行自动化的难度应该也不会比最初的MAGE难。
上一个优化策略兼顾了重组效率和背景突变率,但还是遗留下了一些问题,包括时间上占整个程序很大比例的细胞生长过程所必须维持的32℃限制了E. coil的生长,另外在编辑完成之后,对用来进行表达相关蛋白的质粒的丢失可控性比较差。
为解决这些问题,一项叫做瞬时突变体-多重自动化基因组编辑(Transient Mutator Multiplex Automated Genome Engineering: TM-MAGE)(6)的技术被提出来。和之前版本的MAGE明显不同的是他们的策略是基于质粒的,没有对底盘E. coil的基因组进行预修饰,在他们策略中内源错配修复机器功能的丧失是通过过表达一个甲基化酶Dam来实现的,Dam是之前一个筛选过表达后突变率升高的基因实验中,所筛到次数最多的基因。用一个诱导型的启动子控制dam的表达就同样可以实现MMR功能条件性的丧失,这样以来也就避免了细胞生长阶段温度对生长的限制。质粒的自然丢失需要在无选择压力的培养基上将菌株培养很多代,在向质粒中插入一个反向标签-sacB后,我们则可以很快的将那些已经基因组已经被修饰过,用于编辑的质粒也被丢失掉的菌株筛选出来。sacB基因表达的产物对蔗糖敏感,当培养基中有蔗糖存在时对于宿主是致死的,筛选丢失了质粒的菌株时只需在培养基中添加蔗糖就好。
在MT-MAGE技术在线发表前的10多天,另外一篇开发了强化版的MAGE—pORTMAGE技术的文章被送到了PNAS的编辑部进行审核,pORTMAGE(7)也是基于质粒的技术,与MT-MAGE相比,pORTMAGE扩宽了技术适用的宿主范围,重组效率提高的策略方面他们和之前的工作保持了一致,在条件性失活MMR的功能时他们的策略是用一个温敏型抑制子来控制一个MutL 基因的dominant-negative 突变等位基因(dominant-negative mutatorallele of MutL)。这个突变了的MutL表达时可以起到使宿主丧失MMR活性的效果。在几个和临床、生物技术相关的菌株中也能够成功的应用这个技术的关键之一是他们将这些能实现不同功能的结构元件整合到了一个通用性的载体上,另外MutL基因在这几个菌株中保持着相对较高的保守性也是突变型的MutL能在其它宿主中失活MMR活性的关键。
从pORTMAGE应用最终的效果来看,它能够在所选择的三个不同菌株期望的位点快速地形成一个庞大且无偏好性的文库,也能同时保证高效的编辑重组效率以及低脱靶率。发展至此,该技术还是存在一些潜在的问题,比如要进一步拓宽它在其它物种中的应用时需要保证其它宿主中的错配修复机器和E. coil中的必须要有相当的保守性。另外,这一系列MAGE的应用还严重依赖于特定的重组酶和载体,拓宽可用的重组酶以及载体也是未来应该强化的方向。
最近对MAGE进行优化所产生的版本是CRISPR/Cas9 and λ Redrecombineering based MAGE technology (CRMAGE)(8),CRMAGE和以往的版本相比首次将能提供反向选择压力的CRISPR-Cas系统整合进来了,CRMAGE功能的实现是依赖于两个可回收的质粒,第一个整合了能够实现条件性失活MMR,提高重组效率和表达Cas9蛋白的结构元件,第二个质粒包含了两组受不同诱导物诱导所表达的sgRNA,其中一个可以和tracrRNA结合介导Cas9蛋白切割未在目标维位点经过编辑的基因组,提供反向选择压力。另外一组则可以在编辑结束后以同样的方式对自身所在的质粒的骨架进行切割,从而去除掉。尽管在开发CRMAGE技术的文章中还未利用它对多个位点进行编辑,但是从利用它对单个或者两个位点编辑的效率来看是要显著高于传统的MAGE的,编辑单个位点时两者的成功率分别为98%和5%,在用CRMAGE进行两个点的同时编辑时,前者效率也能达到95%以上。但是利用整合了Cas9切割能力的MAGE来说,是否能够同时大量的对多个位点进行修饰,起始还存在很多挑战,因为在细菌基因组中同时引入多个双链切口时,可能会多对宿主的生存产生很大的负面影响。
eMAGE(Eukaryotic MAGE)(9)
除了应用于针对于原核生物的MAGE,在2017年11月,针对于真核模式生物酿酒酵母(Saccharomyces cerevisiae)的eMAGE技术也被开发出来了。在S. cerevisiae中实现MAGE同样依赖于同源重组效率的提高,尽管在缺失了MMR系统的菌株中过表达同源重组因子可以提高重组单链寡聚脱氧核苷酸(ssODNs)的重组效率,但提高的有限所以他们没有采用这种策略。他们所采用的策略主要是借助单链退火蛋白λ Red β蛋白或Rad59蛋白来提高ssODNs的重组效率,同时采取的强化同源重组效率的措施还包括加入选择标签实现共筛选、敲除掉可能和DNA复制叉退火模型相竞争的依赖于Rad51的单链DNA入侵模型中的关键蛋白Rad51、通过后随链引入合成的ssODNs、加入羟基脲减缓复制叉的速度以及失活掉内源的错配修复机器。
将上述的措施整合起来,最终他们将S. cerevisiae中单个ssODNs同源重组的效率从大约10^-4%~10^-3%提高到超过40%,同时在目标基因位点未发现不期望的突变。当使用一个总共包含了74个ssODNs的ssODN库,对异源表达了β-胡萝卜素合成途径的S. cerevisiae进行改造时,这些ssODNs可以分别靶向到β-胡萝卜素合成途径中四个组成型表达基因的482个特定碱基并且可以对这些特定位点的碱基进行替换。经过一轮MAGE,出现了多种不同色度的表型,随后对不同突变体的高通量测序发现被分析的菌株分别包含了1-60bp的改变和1-12个ssODNs。这证明了在真核生物中这个技术能够有效的同时对多个不同位点的碱基进行替换,同时也能有效地形成组合的遗传突变体。
需要注意的是无论是MAGE还是eMAGE所适用的是同时对多个位点的单碱基进行替换,而要进行大片段的基因重组,借助能够提供强大的靶向切割能力的CRISPR基因编辑技术可能是更好的选择。此外,在S. cerevisiae建立eMAGE时对宿主所做的改造都是针对于在真核生物中保守的机制,这也就意味着eMAGE的框架能够为在多细胞真核生物包括植物和动物中建立高效的多重基因组编辑技术提供启示。
纵观这个技术从创立之初到目前所经历过的一系列优化可以给我们提供这样一些启示,要想实现复杂的遗传操作,比较好的方式应该是先把这种复杂遗传操作的实现所需的功能进行拆分,然后寻找能够实现相应功能的结构元件,最后再将这些结构元件以尽可能简单的方式进行整合去实现期望的功能。
再回到已灭绝物种再生的话题上,事实上再生猛犸并不是唯一一个尝试利用基因编辑和克隆技术来实现灭绝物种再生的例子,早在2012年就有利用克隆技术来再生1999年已灭绝的西班牙羱羊的先例,可惜的是新生的羊宝宝仅仅存活了数分钟。随着基因编辑技术效率逐渐的提高以及克隆技术的成熟这种尝试在技术层面上的成功的可能性必将越来越大,除了如何去推动这些技术的发展,再生已灭绝物种有什么意义?将他们释放到现有的生态系统中会对现有的生态系统产生怎样的影响?也应该是未来需要考虑的问题。
所属研究所及研究组简介
中国科学院青岛生物能源与过程研究所是由中国科学院、山东省人民政府、青岛市人民政府于2006年共同筹建,聚焦前沿生物技术、先进材料和可再生能源领域,已经形成了涵盖生物、化工、材料等的交叉学科培养体系。研究所目前在职职工500余人,平均年龄35岁,科研骨干85%具有海外留学工作经历,超过100余人次获得“国家杰出青年基金”、国家“万人计划”、国家“千人计划”、中科院“百人计划”等人才计划和奖励。研究所的战略目标是建设成为国内领先、国际一流,引领我国先进生物能源、先进生物基材料、先进能源应用技术的自主创新研发平台。目前拥有山东省合成生物学重点实验室,山东省合成生物技术创新中心(筹)两个合成生物学的省级科研平台。
微生物代谢工程研究组由“国家杰出青年基金”获得者及国家“万人计划”入选者吕雪峰博士领衔,国家“千人计划”入选者张凯博士近期加盟研究组。研究组内由从分子育种的上游技术到产业化应用的跨学科的高端专业技术人才构成,研究内容涵盖从基础研究到产业化应用全技术链的开发,主要包括如下研发方向:1)蓝细菌光合生物合成2)光合微藻规模化培养3)土曲霉天然产物生物合成。
参考文献及资料
1. H. H. Wang et al., Programming cells by multiplex genome engineering andaccelerated evolution. Nature 460, 894-898 (2009).
2. F. J. Isaacs et al., Precise manipulation ofchromosomes in vivo enables genome-wide codon replacement. Science 333, 348-353(2011).
3. H. H. Wang, G.Xu, A. J. Vonner, G. Church, Modified bases enable high-efficiencyoligonucleotide-mediated allelic replacement via mismatch repair evasion. Nucleic Acids Res 39, 7336-7347 (2011).
4. P. A. Carr et al., Enhanced multiplex genomeengineering through co-operative oligonucleotide co-selection. Nucleic Acids Res 40, e132 (2012).
5. A. Nyerges et al., Conditional DNA repair mutantsenable highly precise genome engineering. NucleicAcids Res 42, e62 (2014).
6. R. M. Lennen et al., Transient overexpression of DNAadenine methylase enables efficient and mobile genome engineering with reducedoff-target effects. Nucleic Acids Res44, e36 (2016).
7. Á. Nyerges et al., A highly precise and portablegenome engineering method allows comparison of mutational effects acrossbacterial species. Proceedings of theNational Academy of Sciences of the United States of America 113, 2502 (2016).
8. C. Ronda, L. E.Pedersen, M. O. Sommer, A. T. Nielsen, CRMAGE: CRISPR Optimized MAGERecombineering. Sci Rep 6, 19452 (2016).
9. E.M. Barbieri, P. Muir, B. O. Akhuetie-Oni, C. M. Yellman, F. J. Isaacs, PreciseEditing at DNA Replication Forks Enables Multiplex Genome Engineering inEukaryotes. Cell 171, págs. 1453-1467 (2017).
10. 《如果无法复活猛犸象,我们至少可以拍一部科幻电影来挣钱》MIT科技评论 2017.7.11
11. Jennifer A.Doudna and Samuel H. Sternberg A crack in creation, 2017